# autor: Fabiano A. Lima
# Este arquivo contém o código usado para obter os dados dos sites dos veículos
# usados no estudo. Como esses sites podem sofrer alteração, reocmenda-se que, para fins de 
# reprodutibilidade, se use os arquivos salvos quando da elaboração dos estudo. 

library(tidyverse)
library(rvest)
library(urltools)
library(lubridate)

source("pesquisador.r", encoding = "utf8")
source("gera_tabela.r", encoding = "utf8")

folha <- folha() 
o_globo <- o_globo()

data_ini <- "01/04/2006"
data_fim <- "31/12/2007"

criterios <- c("Operação", "Operação e Magistrado", "Magistrado", "Magistrado sem Operação")

# Monta tabela básica somente com sumário das buscas (resultados totais)

valores_folha <- c(
  folha$busca_texto("todos:sanguessugas", data_ini, data_fim, T, T)$total,
  folha$busca_texto("todos:juiz Jefferson Schneider sanguessugas", data_ini, data_fim, T, T)$total,
  folha$busca_texto("todos:juiz Jefferson Schneider", data_ini, data_fim, T, T)$total,
  folha$busca_texto("todos:juiz Jefferson Schneider, nenhum: sanguessugas", data_ini, data_fim, T, T)$total
)

valores_globo <- c(
  o_globo$busca_texto("", "sanguessugas", "", "", data_ini, data_fim, T, T)$total,
  o_globo$busca_texto("", "juiz Jefferson Schneider sanguessugas", "", "", data_ini, data_fim, T, T)$total,
  o_globo$busca_texto("", "juiz Jefferson Schneider", "", "", data_ini, data_fim, T, T)$total,
  o_globo$busca_texto("", "juiz Jefferson Schneider", "", "sanguessugas", data_ini, data_fim, T, T)$total
)

# Consolida resultados em dataframe único para salvar em arquivo

tbl_citacoes <- tibble(
  "Critério" = criterios,
  "Folha" = valores_folha,
  "O Globo" = valores_globo 
)

saveRDS(tbl_citacoes ,"./data/tbl_citacoes_js_sanguessugas.rds")
write.csv(tbl_citacoes ,"./data/tbl_citacoes_js_sanguessugas.csv")


